FILTER MODE ACTIVE

#мультимодальный ИИ

Найдено записей: 27

#мультимодальный ИИ21.11.2025

Ставка Luma AI за $900M: создание мультимодальной "мировой модели"

'Luma AI закрыла раунд на $900M и ориентируется на мультимодальные World Models, способные понимать видео, аудио и 3D-пространство. Партнёрство с саудовским суперкластером подчёркивает серьёзность намерений.'

#мультимодальный ИИ

Ставка Luma AI за $900M: создание мультимодальной "мировой модели"

Gemini 3: Google учит ИИ собирать визуальные интерфейсы и действовать как агент

Qwen-Image-Edit: новая 20B-модель Alibaba для точного редактирования изображений и синтеза новых ракурсов

Google Gemini превращает вязание крючком в потрясающее цифровое искусство

NVIDIA ThinkAct: революция в управлении роботами через визуально-языковое планирование

RoboBrain 2.0: Революция в робототехнике с объединённым зрительно-языковым ИИ

Alibaba представляет Lumos-1: прорывная унифицированная автогрессивная модель для эффективной генерации видео

Alibaba представляет Qwen-VLo: продвинутую унифицированную модель для мультимодального ИИ творчества

BAAI представляет OmniGen2: прорывная унифицированная модель для мультимодального ИИ

Архитектура WINGS: решение проблемы забывания текста в мультимодальных крупных языковых моделях

VeBrain: Революция в робототехнике с объединённым мультимодальным ИИ для зрения и управления

NVIDIA запускает Llama Nemotron Nano VL: эффективная модель для комплексного анализа документов

MiMo-VL-7B: Продвинутая модель для визуального восприятия и мультимодального анализа

Как плохие данные о товарах вредят моде и какую роль в этом играет ИИ

Google представляет MedGemma: продвинутые мультимодальные ИИ-модели для анализа медицинских текстов и изображений

Почему ИИ испытывает трудности с аналоговыми часами и что это говорит о понимании машин

Модели OpenAI o3 и o4-mini: новые стандарты визуального анализа и программирования

Исследователи представили General-Level и General-Bench для оценки истинной синергии в мультимодальном ИИ

Ming-Lite-Uni: Революционный открытый AI-фреймворк для объединения текста и визуальных данных

X-Fusion: расширение замороженных языковых моделей с визуальными возможностями без потери языковых навыков

UniversalRAG: Динамический мультимодальный поиск для умных ответов ИИ

Alibaba Представляет Qwen2.5-Omni-3B: Мощный Мультимодальный ИИ для Потребительских GPU с Вдвое Меньшим Использованием Видеопамяти

Google NotebookLM запускает аудио обзоры на более чем 50 языках для глобальной доступности ИИ-суммаризации

Как Judge-Image от Patronus AI меняет будущее оценки мультимодального ИИ

Skywork AI представляет R1V2: прорыв в мультимодальном рассуждении с гибридным обучением с подкреплением

NVIDIA Представляет Describe Anything 3B: Продвинутая Мультимодальная Модель для Точного Описания Изображений и Видео

Новые возможности OpenAI: модели o3 и o4-mini с мультимодальным мышлением и интегрированными инструментами